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摘要 : 【 目的 】 面 向 语义 出 版 构建 论文 写作 工具 , 在 论文 写作 阶段 实现 内 容 结 构 化 、 对 象 化 , 使 得 一 篇 论文 即 是 


付 常 雷 ， 


许 丽 媛 


一 个 系统 ,论文 可 运行 、 可 交互 、 可 体验 。[ 方法 】 采用 数字 对 象 和 数字 模板 技术 将 论文 内 容 (元 数据 、 章 节 、 数 
据 、 富 媒体 等 ) 分 解 成 不 同类 型 数字 对 象 , 数字 对 象 间 采 用 模板 进行 组 织 , 通过 事件 触发 机 制 实现 交互 , 采用 
HTMLS 网 页 形式 进行 编辑 和 呈现 并 存储 为 XML 结构 化 文档 包 。[ 结果 ]DPaper 结构 化 论文 写作 工具 已 上 线 , 提 


供 从 素材 收集 ( 云 笔 记 )、 数 字 对 象 制作 、 自 动 标 引 参考 文献 、 按 期 刊 版 式 呈现 到 Word 文档 格式 转换 等 一 系列 功 
能 ,论文 内 容 实现 对 象 化 和 部 分 语义 化 。[ 局 限 】 与 常规 论文 编辑 器 相 比 ,数字 对 象 编辑 器 功能 还 不 完善 , 还 不 
能 创建 公式 、 图 形 等 对 象 , 排版 的 灵活 性 不 足 。[ 结论 ] 利用 DPaper 写作 工具 可 以 在 写作 阶段 由 作者 构建 出 满 


是 语义 出 版 应 用 需求 的 结构 化 论文 。 
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数字 环境 下 学 术 论文 的 形态 及 利用 方式 出 现 了 许 
多 新 的 趋势 , 内 容 结 构 化 、 对 象 化 、 语 义 化 等 数字 化 
表征 使 得 面向 细 粒 度 内 容 的 应 用 不 断 推陈出新 。 语 义 
出 版 作为 一 种 新 的 应 用 形式 近年 来 进入 快速 发 展 时 
W, 它 能 使 论文 间 的 数据 整合 变 得 更 加 容易 踢 ， 知识 
对 象 与 知识 关系 可 进行 鉴别 和 标 引 ,并 把 解析 逻辑 与 
结果 作为 内 容 出 版 的 有 机 组 成 部 分 外。 STM 2015 年 技 
术 趋 势 报告 认为 口 : 期 刊 论文 正人 处 于 “Hub and Spoke" 
出 版 模型 的 中 心 位 置 , 连接 视频 、 图 形 、 表 格 ， 以 及 多 
种 不 同 的 数字 对 象 (Artifacts)， 其 中 数据 正 上 升 为 首要 
(First-Class) 研 究 对 象 。 在 其 2014 年 的 趋势 图 中 描绘 了 


新 式 论 文 的 场景 喇 : 可 计算 、 富 集 化 ( 含 可 交互 的 数据 
查看 右 、 图 形 / 图 像 、 图 表 、 可 视 化 、 活 的 方程 等 )， 可 
使 出 版 变 成 软件 模型 ， 作 者 和 研究 者 均 具 有 更 好 的 
体验 。 

然而 , 目前 还 没有 一 种 真正 可 用 的 论文 写作 工具 ， 
辅助 作者 在 创作 阶段 生成 满足 语义 出 版 要 求 的 结构 化 
论文 。 为 此 , 笔者 开发 了 一 种 面向 语义 出 版 的 结构 化 
论文 写作 工具 一 一 DPaper (http://idpaper.las.ac.cn/), Ff 
在 从 根本 上 改变 论文 的 利用 模式 , 在 写作 阶段 实现 内 
容 结构 化 、 对象 化 , 论文 变 成 软件 模型 ， 一 篇 论文 即 是 
一 个 系统 , 论文 可 运行 、 可 交互 、 可 体验 , 作者 的 研究 
数据 、 研 究 过 程 及 研究 结果 可 为 读者 操作 和 复 用 。 本 
文 将 阐述 该 工具 主要 研究 思路 和 系统 设计 实现 方法 。 


通讯 作者 : REL, ORCID: 0000-0002-7114-5544, E-mail: lexq@mail.las.ac.cn。 


*# 本 文部 分 内 容 已 发 表 于 《Journal of Data and Information Science》 
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2 相关 研究 


近年 来 , 在 面向 语义 出 版 的 结构 化 论文 研究 方面 
已 有 一 些 探 索 , 基本 思路 是 使 论文 内 容 对 象 化 和 语义 
化 ,主要 有 三 种 做 法 : 将 论文 内 容 模块 化 ; 数字 对 象 封 
装 并 进行 语义 描述 ; 语义 标注 。 具 有 代表 性 的 是 模块 
化 论文 模型 和 语义 出 版 模型 。 语 义 标 引 是 目前 文献 内 
容 语义 化 的 主要 手段 ， 有 大 量 研究 与 试验 门 ,本文 不 
作 歼 述 。 

模块 化 论文 模型 由 Kircz 提出 F9， 论 文 由 模块 组 
成 , 模块 被 定义 为 具有 独一无二 特性 、 自 含 概念 表示 
的 信息 单元 , 数据 集 、 图 像 、 音 频 、 视 频 等 被 看 成 是 
独立 但 可 交互 的 对 象 或 模块 聚合 到 论文 中 , 为 便于 交 
流 , 模块 被 连接 成 固定 单元 。 模 块 化 结构 能 给 阅读 和 
出 版 带 来 更 高 效率 ，Cell 中 的 论文 使 用 了 这 种 模块 结 
构 。 利 用 数字 对 和 象 组 织 学 位 论文 也 是 模块 化 思想 的 典 
型 应 用 , 做 法 是 将 数字 对 象 应 用 融入 现 有 的 电子 化 学 
位 论文 系统 中 ,提供 METS/XML 转换 .导入 导出 功能 ， 
典型 工具 为 OpenETD, 它 既是 一 个 独立 的 学 位 论文 提 
交 系 统 , 也 是 一 个 利用 METS/XML 导出 功能 实现 机 
构 仓 储 的 组 件 四 。 在 ProQuest/UMI 系统 中 , 音频 、 视 
频 、 数 据 集 (SpreadSheets) 等 富 媒体 均 以 学 位 论文 补充 
文件 的 形式 在 线 提交 到 系统 中 , 提交 时 需 填 写 相 应 的 
TE e A, 

在 语义 出 版 模型 中 ，Hunter 提出 科学 出 版 包 
(Scientific Publication Package,，SPP) 新 信息 格式 中 用 
于 封装 原始 数据 、 来 源 产品 、 算 法 、 软 件 、 文 本 、 相 
关上 下 文 环境 以 及 原 数 据 , 使 科学 家 能 够 获取 、 索 引 、 
存储 、 共 享 、 交 换 、 重 用 、 比 较 和 集成 科学 结果 。SPP 
基于 许多 科学 概念 模型 是 一 种 用 RDF 包 表 示 的 复合 
数字 对 象 , 复合 对 象 内 部 原子 对 象 间 的 关系 要 么 在 元 
数据 获取 时 从 本 体 规则 推理 中 明确 定义 , 要 么 由 科学 
家 在 SPP 描述 时 定义 。 强 调 工作 流 技 术 作为 科学 过 程 
的 组 成 部 分 , 用 于 获取 产生 科学 数据 和 来 源 产品 的 处 
理 步 又 链 ， 可 使 科学 家 们 以 一 种 可 重复 、 可 证 实 、 分 
布 的 方式 描述 和 执行 他 们 的 实验 过 程 , 追踪 错误 来 
源 、 处 理 缺 陷 5。 

在 面向 语义 出 版 的 结构 化 论文 编辑 工具 方面 , H 
前 还 没有 看 到 通用 性 工具 , 但 BioLit 项 目 和 SCOPE 
(Scientific Compound Object Publishing and Editing 
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System) 项 目 分 别 从 语义 标记 和 复合 数字 对 象 的 角度 
开展 了 有 益 探索 。Fink 等 在 BioLit 项 目 中 开发 了 基于 
XML 的 写作 工具 , 利用 美国 医学 图 书馆 的 文档 类 型 
定义 (NLM DTD) 存 储 标准 化 旦 机 器 可 读 的 出 版 物 中 1。 
这 个 DTD 也 包括 一 些 对 文章 本 身 和 对 象 内 容 ( 如 图 、 
表 ) 的 语义 标记 、 唯 一 标识 符 。 该 工具 将 为 开放 文献 和 
生物 学 数据 的 集成 提供 方便 , 使 用 PLoS 和 Protein 
Data Bank (PDB) 的 全 部 语 料 做 测试 nb9。 

SCOPE 工具 开展 了 让 研究 者 自己 构建 数字 对 象 
的 尝试 , 这 是 面向 语义 出 版 结构 化 论文 的 最 终 出 路 ， 
因为 只 有 作者 最 清楚 具体 的 研究 过 程 、 计 算 方法 、 实 
验 材料 、 实 验 数据 及 结果 ( 耻 。SCOPE 是 一 个 利用 
OAI-ORE 规范 的 数字 内 容 串 联 工 具 , 它 是 一 种 科学 复 
合 对 象 出 版 和 编辑 系统 , 设计 用 于 使 科学 家 易于 创 
作 、 出 版 和 编辑 科学 复合 对 象 , 使 科学 家 封装 科学 实 
验 或 发 现 过 程 中 不 同 的 数据 集 和 资源 , 单个 复合 对 象 
可 出 版 和 交换 (3。 但 SCOPE 构造 示例 显示 复合 对 象 
的 构造 过 程 需 借 助 语 义 网 关系 ,即使 是 ICT 专家 也 很 
难 完成 构建 , 无 论 是 可 用 性 还 是 实用 性 均 很 难 满足 现 
实 需求 。 
3 系统 设计 
31 面向 语义 出 版 的 论文 写作 工具 概念 模型 

目前 论文 写作 大 多 采用 文档 编辑 器 (如 Word 
等 ), 论文 内 容 以 静态 复合 文档 (如 Doc/PDF 格式 ) 的 
形式 存在 ,内容 非 结构 化 、 非 语义 化 、 且 交互 能 
弱 ， 使 得 作者 的 研究 数据 和 过 程 较 难 完整 、 有 效 地 
展示 给 读者 , 研究 结果 不 易 被 同行 有 效 利用 、 理 解 、 
观察 和 验证 。 

面向 语义 出 版 的 论文 写作 工具 是 一 种 可 计算 、 可 
复 用 /验证 、 可 交互 的 论文 系统 ,其 内 容 可 操作 、 可 组 
配 、 可 发 布 , 具备 多 种 呈现 方式 。 利 用 这 种 工具 创作 
的 论文 应 具备 以 下 能 

(1) 论文 可 运行 , 一 篇 论文 可 发 布 成 一 个 应 用 系统 ; 

(2) 论文 用 数字 对 象 表示 , 内 容 结构 化 、 语 义 化 ; 

(3) 具有 丰富 的 富 媒体 对 象 ， 能 充分 展示 科学 研 
究 过 程 及 成 果 ; 

(4) 数字 对 象 可 独立 运行 , 可 组 合 、 定 制 ， 满 足 语 
义 出 版 的 需求 。 

DPaper 在 设计 中 引入 模块 化 论文 模型 的 思想 中 
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通过 构建 规范 化 数字 论文 模板 , 将 学 位 论文 的 内 容 组 
织 与 表现 分 离 , 学 术 论 文 不 再 是 一 个 静态 复合 文档 ， 
而 是 一 种 可 配置 、 可 操作 、 可 传递 、 可 交换 、 可 保存 
的 数字 对 和 象 集 。 数 字 对 象 间 彼此 关联 ， 内 容 的 组 织 采 
用 开放 的 元 数据 标准 (如 METS、Dublin Core 等 ) 进 行 
描述 , 内容 的 呈现 采用 Web 形式 进行 展示 。 数 字 对 象 
的 操作 上 , 制定 相应 处 理 规范 及 接口 标准 , 将 一 些 复 
合 数字 对 象 变 成 可 集成 的 微服 务 。 
3.2 ”系统 处 理 框 架 

DPaper 系统 框架 如 图 1 所 示 : 
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图 1 DPaper 系统 处 理 框架 


DPaper 系统 由 文档 数字 化 表示 、 数 字 对 象 制作 、 
数字 文档 编辑 、 文 档 Web 呈现 以 及 数字 文档 存储 5 部 
分 构成 : 

(1) 文档 数字 化 表示 主要 是 利用 描述 规范 制定 相 
应 的 数字 化 论文 模板 ; 

(2) 数字 对 象 制作 负责 对 象 数据 的 管理 、 对 象 交 
互 、 封 装 以 及 数据 的 转换 等 处 理 ; 

(3) 数字 文档 编辑 是 数字 论文 创作 、 编 辑 、 修 改 
的 场所 ,以 论文 组 织 结构 单元 为 基础 组 织 数 字 对 象 ， 
在 编辑 过 程 中 数字 对 象 被 赋予 语义 标签 ， 从 而 实现 对 
象 的 结构 化 和 语义 化 ; 

(4) 编辑 器 中 的 数字 对 象 按照 模板 进行 个 性 化 组 
配 , 彼此 间 数 据 关 联 ， 以 网 页 的 形式 呈现 , 提供 浏览 
和 发 布 功能 ; 

(5) 论文 中 的 数字 对 象 及 其 数据 以 Web 包 的 形式 
进行 存储 , 同时 将 结构 描述 信息 存储 于 XML 数据 文 
件 中 , 用 于 数字 文档 的 交换 和 第 三 方 软件 复 用 。 
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4 关键 技术 方法 


4.1 论文 数字 对 象 组 织 
对 论文 内 容 按 粒度 进行 分 解 和 描述 , 参照 METS、 
Dublin Core 以 及 NCBI 和 NLM 制定 的 图 书 与 收藏 标 
签 库 (Book and Collection Tag Library version 3.0)03 对 
学 位 论文 内 容 进行 规范 化 描述 ， 如 图 2 Bron: 
标题 
作者 
机 构 


封面 
摘要 声明 
C 目录 (图 / 表 ) 
大 纲 
标识 号 (UUID) 图 集 
idi Media) 5 频 
内 容 视频 
T Text 地 图 


图 2 结构 化 论文 数字 对 象 组 织 框架 


描述 框架 由 论文 元 数据 对 象 、 论 文 组 织 结 构 对 象 
和 内 容 对 象 三 部 分 构成 : 

(1) 论文 元 数据 采用 Dublin Core 中 的 元 素 集 描 
述 , 包括 论文 标题 、 作 者 、 机 构 、 中 文摘 要 、 英 文摘 
要 、 关 键 词 等 ; 

(2) 论文 组 织 结 构 对 象 涵盖 封面 、 声 明 、 目 录 、 
大 纲 、 参 考 文献 、 致 谢 、 附 录 等 类 别 ; 

G) 内 容 对 象 包括 章 、 小 节 ; 富 媒 体 对 象 涵盖 图 
表 、 图 片 /图 集 、 音 频 、 视 频 、 动 画 、 地 图 、 数 据 、 网 
络 图 、 算 法 、 软 件 等 。 每 个 数字 对 象 用 UUID 进行 统 
一 标识 。 例如, 章节 对 象 (Section) 记 录 每 章 的 结构 和 对 
应 内 容 , 使 用 Sec-id( 章 节 编 号 )，Sec-title( 章 节 标 题 )， 
Sec-content( 章 节 内 容 ) 三 个 元 素 进 行 描述 ， 图 片 /图 集 、 
图 表 、 音 频 、 视 频 等 数据 均 以 对 象 的 形式 进行 描述 并 
ABI BE d rp 
4.2 ”数字 对 象 间 通 信和 与 交互 

Dpaper 系统 中 的 数字 对 象 集 数据 载 人 、 处 理 、 编 
辑 、 呈 现 、 存 储 等 操作 为 一 体 ,数字 对 象 之 间 数 据 可 
以 相互 调用 , 一 个 对 象 的 数据 操作 可 即时 触发 另 一 个 
对 象 在 编辑 、 运 行 中 的 状态 和 结果 。 这 种 交互 过 程 主 
要 通过 事件 触发 机 制 完成 ， 当 用 户 执行 某 些 操作 时 ， 
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系统 内 部 会 通知 相应 数字 对 象 做 出 更 新 响应 。 
在 DPaper 中 , 数字 对 象 定义 了 多 种 响应 事件 ,， 主 

要 包括 : 新 增 、 开 始 修改 、 结 束 修改 、 删 除 、 复 制 、 
擦 除 等 。 事 件 处 理 过 程 : 文档 操作 (按钮 /快捷 键 ) 一 环 
触发 新 事件 操作 


新 增 (M) — 


DataSourceChng(A) «— | 修改 (开始 、 结 束 ) 


DataSourceDel(A) ”< 一 | 删除 (MD) < 一 


触发 事件 
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境 处 理 一 触发 Before 事件 , 做 权限 检查 等 相关 操作 
一 触发 Manager 响应 事件 一 触发 After 事件 一 完成 事 
件 。 数 据 对 象 基本 事件 (新 增 、 修 改 、 删 除 ) 响 应 流程 
如 图 3 所 示 : 


响应 环境 /数据 源 事件 
B/A Create Create 
B/A Modify < 一 开始 /完成 编辑 (btn) 
B/A Delete —— Del(btn) 


图 3 数字 对 象 事件 响应 流程 


4.3 ”数字 对 象 语义 描述 

采用 数字 模板 技术 对 数字 论文 中 定义 的 不 同 粒度 
的 数字 对 象 标记 相应 语义 标签 , 由 系统 自动 生成 。 为 
了 减少 编辑 操纵 的 复杂 度 ， 系统 暂 未 对 数字 对 象 中 的 
内 容 进行 更 为 详细 的 语义 化 处 理 。 在 DPaper 中 , 选用 
“中 国 科学 院 人 硕士 学 位 论文 "模板 以 及 《现代 图 书 情报 
技术 》 期 刊 论文 模板 构建 了 学 位 论文 和 期 刊 论文 两 类 
数字 化 模板 。 模 板 采 用 4.1 节 中 定义 的 元 素 进行 标记 ， 
论文 中 不 同 粒度 的 数字 对 象 (如 封面 、 声 明 、 标 题 、 作 
者 、 机 构 、 章 节 、 图 表 、 参 考 文献 等 ) 的 字体 、 字 号 、 
样式 位置 构成、 格式 在 模板 做 了 具体 定义 , 以 XML 
文件 的 形式 记录 在 系统 中 , 供 论文 对 象 编辑 时 调用 。 
图 4、 图 5 分 别 是 学 位 论文 封面 对 象 和 参考 文献 对 象 
的 语义 描述 实例 。 


r> 
cher> 张 厌 </GraduateTeacher> 
cherCompany> 中 国 科学 院 文献 情报 中 心 </GraduateTeacherCompany> 
> 硕士 学 位 </DegreeType> 

</Major> 


2010 年 1 月 </ArticleTimeDefence> 
院 文献 情报 中 心 </CultivateCollege> 


uthorE> 
heng</GraduateTeacherE> 
eE>January, 2010</ArticleTimeE> 


<Statement> 

<Colleges> 中 国 科学 院 文献 情报 中 心 </Colleges> 
«Authors» T TR «/AuthorS» 
«TeacherS»X £M -/TeacherS» 
«TimeS52010.1 «/TimeS 


图 4 学 位 论文 封面 对 象 语义 描述 


4.4 学 位 论文 数字 对 象 重 用 机 制 
DPaper 目前 提供 数据 重用 、 数 字 对 象 重用 以 及 整 
篇 论文 重用 三 种 模式 。 


图 书 Omox © 会 议论 文 学 位 治文 
LIEST FO € B RA 


NES] 


«refer meta id-"D5B536AD13B64FF0977F2028BABA954C'-- 
«text»[1] 周志 远 .<a href-"http:/ /www.cnki.com.cn/Article/CJFDTotal- 
WGYW200701009.htm" target="_blank"> 认 知 语 境 : 关 详 理 论 对 词汇 语 用 学 的 解释 力 </a> 
D] 外 国语 言 文学 研究 ,2007, 卷 (期 ): 页 码 .</text> 
- «meta data» 
- <![CDATA[ 
%0 Journal Article 
$A 周志 远 
AT 认 知 语 境 :关联 理论 对 词汇 语 用 学 的 解释 力 
*J 外 国语 言 文学 研究 
4D 2007 


图 5 学 位 论文 参考 文献 对 象 语义 描述 
(1) 数据 重用 
数字 对 和 象 中 的 数据 通过 格式 转换 达到 数据 复 用 的 
目的 。Dtable、Dchart、 关 系 图 等 数字 对 象 中 的 数据 可 
转换 成 JSON 、CSV、RDF/XML 等 格式 数据 文件 。 

(2) 数字 对 象 的 重用 

数字 对 象 中 的 数据 、 程 序 及 库 文 件 等 封装 成 独立 
的 Web 包 , 具有 访问 人 口 和 对 象 描述 元 数据 ,离开 
DPaper 环境 能 独立 在 浏览 器 中 运行 。 对 象 复 制 后 , 能 
ON Baie rep. 

(3) 整 篇 论文 重用 

在 系统 内 部 , DPaper 使 用 论文 结构 、 论 文 数据 、 
显示 格式 三 个 XML 文件 : 论文 结构 文件 用 于 记录 论 
文 对 象 间 的 层级 关系 ; 数据 文件 记录 论文 的 元 数据 
以 及 数字 对 象 的 内 容 、 路 径 、 位 置 等 信息 ; 显示 格 
式 文 件 记 录 论 文中 各 类 数字 对 象 在 规范 显示 模板 中 
的 显示 信息 ， 如 字体 、 字 号 、 位 置 、 颜 色 、 样 式 等 。 
这 些 内 部 结构 文件 在 用 于 数字 保存 或 文档 交换 时 ， 
采用 分 离 式 METS 电子 文档 的 形式 进行 转换 ， 如 图 
6 所 示 。 
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DPaper 结构 化 论文 


保存 与 交换 


编辑 与 呈现 


a a 论文 描述 (XML) 


论文 | | 数据 | | 显示 格式 | ,| 分 离 式 METS | 
结构 | | 文件 | | 文件 |， | PEG lwt 


图 6 DPaper 结构 化 论文 的 存储 与 转换 


5 工具 应 用 


5.4 DPaper 软件 构成 及 主要 功能 

DPaper 由 论文 编辑 器 、 云 笔记 和 Word 插件 三 部 
分 构成 , 如 图 7 所 示 。 

各 部 分 主要 功能 如 下 : 

(1) 论文 编辑 带 是 PC 端 桌面 软件 ,为 结构 化 论文 
构建 的 主 平 台 , 负责 论文 的 创建 、 数 字 对 象 的 创建 、 
制作 ,对 象 内 容 的 编辑 、 数 据 管 理 、 对 象 管理 、Web 
预览 、 文 档 转 换 等 功能 ; 

(Q2) 云 笔 记 用 于 收集 论文 研究 素材 及 团队 协作 写 


| 选取 数字 论文 模板 |》 生成 规范 化 版 式 论文 原型 


4 
文本 类 对 象 编辑 | 生成 标题 、 摘 要 、 目 录 、 章 、 节 等 


ug pug o ERAS UR E, d. ER. 
AI, MAXAR MUS 
用 标注 | 3 参考 文献 查找 、 自 动 重 排 、 生 成 


[8 


— 4 
[wemi] >》 规范 版 式 论文 网 页 浏览 导航、 对 象 操作 等 
| 存储 导出 | >》 生成 Wet 文 伯 包 、XMI 数据 文件 

(a) 


作 , 可 在 PC 端 、 手 机 端 、 网 页 端 摘录 笔记 并 实现 数据 
同步 ; 

(3) Word 插件 用 于 在 Word 环境 下 构建 DPaper Zi 
构 化 文档 , 使 得 两 种 文档 间 实 现 转换 。 


PC Client DPaper 
论文 编辑 器 


DPaper MS 
Word 插件 


图 7 DPaper 软件 构成 


5.2 DPaper 论文 构建 过 程 

DPaper 结构 化 论文 构建 流程 如 图 8(a) 所 示 。 图 
8(b) 是 利用 DPaper 生成 的 一 篇 中 国 科 学 院 硕士 学 位 论 
文 结 果 界 面 截 图 。 
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图 8 DPaper 结构 化 硕士 学 位 论文 构建 实例 


6 结 语 


DPaper 探索 了 面向 语义 出 版 的 结构 化 论文 写作 
工具 的 构建 方法 ,面向 论文 写作 生命 周期 设计 实现 了 
一 套 实用 软件 系统 。 采 用 数字 模板 机 制 将 论文 表示 为 
数据 、 结 构 、 呈 现 样式 三 种 相互 分 离 又 彼此 关联 的 结 
构 化 文件 , 在 写作 阶段 实现 论文 内 容 的 结构 化 和 部 分 
语义 化 。 富 媒体 对 象 的 引入 使 得 论文 具备 较 高 的 可 操 
作 性 和 可 复 用 性 , 论文 的 呈现 可 根据 具体 应 用 分 别 产 
^E Word 文档 、 可 为 机 器 阅读 的 XML 文档 、 可 运行 的 
Web 文档 系统 。 从 而 在 创作 的 源头 上 实现 论文 的 结构 


现代 图 书 情报 技术 


化 和 部 分 语义 化 , 对 于 推动 语义 出 版 具有 重要 意义 。 

DPaper 还 有 一 些 不 足 : 主 平台 常规 的 编辑 功能 与 
Word 相 比 还 有 较 大 差距 , 还 不 能 创建 公式 、 图 形 等 对 
象 , 对 于 长 期 习惯 于 用 Word, WPS 撰写 论文 的 作者 来 
说 ,用户 能 和 否 习 惯 这 种 新 的 编辑 模式 还 有 待 实践 验 
证 。 另 外 数字 对 象 在 主 平 台 和 Word 插件 间 还 不 能 平 
滑 调 用 , 稳定 性 需 进一步 提高 。 后 期 将 针对 这 些 问 题 
对 系统 做 相应 改进 。 
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DPaper: A Structured Paper Authoring Tool for Semantic Publishing 
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Abstract: [Objective] We developed a paper authoring tool for semantic publishing, which makes the article's content 
structured and object-oriented. Each paper is a system with executable, interactive and experiential features. [Methods] 
First, we divided the content of each paper (metadata, chapters, data, media etc.) into objects organized by digital 
template. Second, these elements interacted with each other through the event trigger mechanism. Finally, the paper was 
modified and presented with HTMLS pages, and then, saved as XML documents. [Results] DPaper is available at 
1DPaper.las.ac.cn, which provides a series of functions such as material collection (cloud notes), digital object creation, 
automatic reference indexing, Word document format conversion in accordance with periodical layouts etc. The paper's 
content is object oriented and partial semantization. [Limitations] Compared to conventional paper editors, the 
DPaper's digital object editor could not create formulas or graphics, and is not flexible to change layouts. [Conclusions] 
DPaper could help us compose a structured paper that meets the requirements of semantic publishing. 


Keywords: DPaper Semantic publishing Structured paper Digital object Authoring tool 
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